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摘 要 语音 范畴 知觉 是 指 听 者 能 够 区 分 不 同音 位 范畴 的 刺激 而 不 能 
的 范畴 化 程度 可 能 与 刺激 的 声学 相似 度 有 关 ， 相 似 度 越 高 见 


影响 声调 知觉 范畴 化 的 因素 还 包括 母语 背景 
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语音 的 范畴 型 知觉 模式 最 早 是 由 Liberman 
Ae FE m E HE H AY (Liberman, Harris, Hoffman, & 
Griffith，1957), 该 术语 是 指 在 声学 连续 统 中 ， 连 
续 的 语音 刺激 被 感知 为 看 干 离散 范畴 中 的 一 个 ， 
听 者 能 够 区 分 属于 不 同 范畴 的 刺激 ,但 不 能 很 好 
地 区 分 属于 同一 范畴 的 刺激 (Studdert-Kennedy & 
Shankweiler 1970)。 与 范畴 型 知觉 相对 的 是 连续 
型 知觉 , 即 连续 的 语音 刺激 不 能 被 感知 为 离散 范 


畴 中 的 一 个 ， 听 者 对 等 间距 刺激 的 区 分 度 始 终 是 
相同 的 。 
早期 的 语音 范畴 知觉 研究 主要 集中 在 音 段 


上 ， 例 如 , 大量 研 究 表明 人 们 对 辅音 的 感知 属于 
范畴 型 感知 ， 对 元 音 的 感知 则 属于 连续 型 感知 
(例如 ,Fry, Abramson, Eimas, & Liberman, 1962; 
Liberman et al, 1957)。1976 年 ， 王 十 元 发 现 , 被 试 
对 北京 话 阴 平和 阳平 的 感知 也 属于 范畴 感知 
(Wang，1976)， 从 此 声调 的 范畴 感知 问题 也 成 为 
语音 范畴 知觉 研究 的 热点 之 一 。 进 入 新 世纪 之 后 ， 
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区 分 同一 范畴 内 的 不 同 刺 激 。 上 声调 知觉 
知觉 的 范畴 化 程度 越 低 。 除 了 声调 本 身 的 特征 外 ， 


、 年 龄 、 刺 激 所 在 语 境 和 刺激 属性 (语言 和 非 语言 )。 电 生理 技术 
的 使 用 加 深 了 声调 范畴 知觉 的 研究 ， 并 有 助 于 解决 一 些 长 期 


存在 争议 的 理论 问题 。 


随 着 脑 神经 科学 的 发 展 ， 电 生理 学 的 研究 方法 使 
得 探究 声调 知觉 行为 背后 的 神经 机 制 成 为 可 能 。 
本 文 将 对 有 关 声 调 范畴 化 问题 及 其 影响 因素 的 研 
究 进行 评述 。 


1 声调 知觉 的 范畴 化 研究 
1.1 行为 研究 

由 于 技术 的 原因 ， 早 期 的 范畴 感知 研究 都 是 
基于 行为 实验 的 ， 对 刺激 的 辨认 和 区 分 是 范畴 感 
知 实验 的 两 个 组 成 部 分 。 典 型 的 范畴 型 感知 在 辨 


认 率 曲线 和 区 分 正确 率 曲线 上 的 特点 分 别 是 : (1) 
跨 范 畴 边界 的 两 个 相 邻 刺激 的 辨认 率 差 别 远 远 大 
于 处 于 边界 同 侧 的 两 个 相 邻 刺激 的 辨认 率 差 别 ; 
CO) 在 声学 距离 相同 的 情况 下 ， 路 范畴 的 两 个 刺激 
的 区 分 正确 率 高 于 处 于 范畴 同 侧 的 两 个 刺激 的 
分 正确 率 (Liberman et al., 1957)。 

关于 声调 的 范畴 知觉 , 学 界 已 有 大 量 行为 实 
验 的 研究 。 声调 的 感知 究 竞 是 范畴 化 的 还 是 连续 型 
的 , 这 一 问题 在 20 世纪 70 年 代 后 过 激烈 
争论 。 王 士 元 通过 研究 北京 话 阴 平和 阳平 的 知觉 
率先 提出 了 声调 知觉 是 范畴 型 感知 的 假设 (Wang， 
1976)。 然 而 , Abramson (1979) 对 泰语 声调 的 研究 
表明 ,泰语 中 三 个 平 调 的 辨认 虽然 是 范畴 型 的 ， 
但 区 分 曲线 上 都 未 出 现 范畴 边界 处 的 区 分 高 峰 
因此 他 认为 泰语 的 平 调 感 知 是 非 范 畴 型 感知 。 

进入 21 世纪 ,声调 的 范畴 感知 问题 再 次 引起 
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许多 研究 者 的 关注 。 在 汉语 普通 话 和 汉语 方言 声 
调 的 研究 中 ,范畴 型 感知 的 实验 结果 屡见不鲜 ( 例 
Qi, Æ, 2016; Francis, Ciocca, & Ng, 2003; 
Hallé, Chang, & Best, 2004; 刘 思 维 , 2015; Peng et 
al., 2010; 47 ffi, 2012; Shen, 2015; Wang, 1976; 
FME, SH, 2010; Eit, FEA Ai, 2015; Xi, 
Zhang, Shu, Zhang, & Li, 2010; Xu, Gandour, & 
Francis, 2006; 张 林 军 , 2010)。 然 而 , 也 有 研究 者 
得 到 了 非 范畴 型 的 结果 ,例如 Francis 等 人 (2003) 


被 试 对 不 同 声学 线索 的 敏感 程度 是 不 同 的 ， 这 就 
会 造成 知觉 结果 的 差异 。 例 如 , FEE AEE YY St 
(2015) 比 较 了 不 同 的 刺激 设计 对 阳平 -上 声 连 续 
统 感知 的 影响 ,她 们 以 降 升 调 的 拐点 位 置 为 自 变 
量 , 在 不 同 的 下 降 段 降幅 和 上 升 段 升幅 条 件 下 观 
察 声 调 知觉 的 范畴 化 程度 ,结果 表明 ,在 特定 下 
降 段 降幅 和 上 升 段 升幅 条 件 下 ， 阳 平和 上 声 的 知 
觉 才 会 呈现 弱 范 畴 感知 的 特点 。 

另 一 个 值得 注意 的 结果 是 ,在 多 数 针 对 两 个 


对 粤语 三 个 平 调 以 及 两 个 升 调 的 研究 结果 都 与 泰 
语 平 调 的 感知 结果 类 似 。 王 担 佳 和 草 夕 航 (2015) 
对 普通 话 阳平 -上 声 的 感知 研究 也 得 到 了 辨认 率 
和 区 分 率 不 一 致 的 结果 ,对 此 她 们 提出 一 个 假设 ， 
即 调 形 相似 (声学 相似 ) 的 声调 之 间 不 存在 清晰 的 
区 分 范畴 边界 。 根 据 该 假设 , 刘 思 维 (2015) 在 对 北 
京 话 、 重 庆 话 和 天 津 话 声调 的 感知 研究 中 区 分 了 
相 异 调 形 和 相似 调 形 ,结果 表明 ， 相 异 调 形 的 感 
知 呈 现 出 典型 的 范畴 化 特征 ,但 相似 调 形 的 感知 
结果 却 星 现 出 弱 范 畴 化 或 非 范 畴 化 的 特征 。 蔡 走 
清 (2016) 对 合肥 话 声 调 的 研究 结果 也 支持 王 和 草 
提出 的 假设 。 

关于 声调 知觉 是 否 具 有 范畴 化 特征 ,， 前 人 的 
研究 结果 出 现 了 不 一 致 。 造 成 前 人 结果 不 一 致 的 一 
个 重要 原因 是 前 人 所 用 的 声调 类 型 不 同 ，Francis 
等 人 (2003) 认 为 ， 曲 折 调 的 感知 呈现 范畴 型 特征 ， 
而 平 调 的 感知 则 具有 连续 型 特征 。 然 而 ,粤语 两 
种 升 调 的 感知 (Francis et al.，2003) 以 及 普通 话 阳 
EF BEBE NY REE, BEA Ht, 2015) 却 


声学 层面 具有 较 大 相似 性 的 声调 的 行为 实验 中 ， 
辨认 实验 的 结果 都 远 远 好 于 区 分 实验 的 结果 。 从 
前 人 的 结果 看 ， 区 分 实验 结果 在 很 大 程度 上 与 记 
忆 机 制 有 关 。 首 先 ， 记忆 中 的 音 高 衰减 会 影响 一 
部 分 区 分 结果 (Francis & Ciocca, 2003)。 其 次 ， 人 
们 对 于 声调 在 语 流 中 的 各 种 变异 的 记忆 也 会 影响 
一 部 分 区 分 结果 ( 王 想 佳 ， 草 夕 航 , 2015)。 因 此 
如 何 评估 经 典范 畴 知觉 实验 中 区 分 结果 的 可 靠 
是 一 个 很 值得 研究 的 问题 ， 它 既 有 理论 层面 的 
要 性 ， 也 有 技术 层面 的 必要 性 。 而 从 前 人 对 区 
实验 结果 不 符合 理论 预期 的 分 析 看 ,在 两 个 相似 
调 形 的 范畴 感知 实验 中 ， 区 分 结果 与 辨认 结果 的 
矛盾 几乎 是 传统 的 范畴 感知 实验 范式 所 难以 克服 
的 。 此 外 , 还 有 一 个 技术 层面 的 问题 值得 研究 ， 即 
区 分 实验 结果 中 的 个 体 差 异 ， 刘 思维 (2015) 在 她 
的 研究 中 尝试 性 地 对 个 体 差 异 进行 了 简单 分 析 ， 
她 发 现 ， 区 分 实验 结果 中 没有 出 现 区 分 高 峰 ， 并 
不 一 定 是 听 者 不 能 很 好 地 区 分 跨 范畴 的 刺激 ， 
时 候 是 因为 不 同 听 者 感知 到 的 范畴 边界 的 位 置 不 


cnin 


得 到 了 与 泰语 平 调 相 类 似 的 结果 。 由 此 可 见 ， 声 
调 知觉 的 范畴 化 程度 可 能 并 不 仅仅 与 声调 的 类 型 
( 平 、 升 、 降 以 及 更 复杂 的 曲 拱 类 型 ) 相 关 ， 而 是 与 
两 个 声调 的 音 高 曲 拱 是 否 具有 相似 性 相关 : 两 个 
声学 相似 度 低 的 声调 之 间 可 能 存在 较为 清晰 的 知 
觉 范 畴 边界 ， 而 声学 相似 度 高 的 声调 之 间 则 不 存 
在 清晰 的 知觉 边界 。 因 此 ， 相 比 于 以 往 在 声调 范 
畴 研究 中 区 分 平 调和 曲折 调 ， 区 分 相似 调 形 和 相 


同 ,因此 在 结果 的 均值 中 , 个 体 所 具有 的 峰值 就 
被 前 平 了 。 
1.2 ERP 研究 

随 着 脑 神经 科学 的 发 展 , 电 生 理学 的 研究 方 
法 使 得 探究 声调 感知 行为 背后 的 神经 机 制 成 为 可 
fig. ERP 技术 具有 较为 精确 的 时 间 分 辩 率 ,可 以 用 
此 探究 声调 范畴 知觉 的 加 工 过 程 。 到 目前 为 止 , 已 
有 很 多 研究 使 用 ERP 技术 对 声调 范畴 知觉 模式 展 


异 调 形 (这 里 的 调 形 特 指 声调 在 声学 层面 的 音 高 
走向 ， 而 不 是 音 系 学 层面 的 声调 类 型 ) 更 便于 解释 
知觉 结果 。 

声调 连续 统 的 设计 也 会 影响 声调 的 知觉 模 
式 。 对 声调 的 知觉 ,实际 上 是 对 某 种 声学 线索 组 
合 的 知觉 (比如 终点 音 高 、 起 点 音 高 等 ), 不 同 的 连 
续 统 设计 可 能 会 对 不 同 的 声学 线索 进行 改变 ， 而 


开 探 究 (例如 Chandrasekaran, Krishnan, & Gandour, 
2009; Kaan, Barkley, Bao, & Wayland, 2008; Shen, 
2015; Wu et al., 2015; Xi et al., 2010; Zhang et al., 
2011; Zhang, Xi, Wu, Shu, & Li, 2012), 

一 些 ERP 研究 表明 ,声调 母语 者 对 母语 声调 
的 知觉 呈现 范畴 化 特征 ， 具 体 表 现 为 ， 与 范畴 内 
偏差 刺激 相 比 ， 范 畴 间 的 偏差 刺激 可 以 诱发 更 大 


64 心理 科学 


ChinaXiv 合 作 期 刊 


的 电 生理 反应 (Shen, 2015; Xi et al., 2010; Zhang 
et al., 2012)。 例 如 ， 在 前 注意 阶段 , Xi 等 人 (2010) 
考察 了 汉语 普通 话 阳 平 -去 声 连 续 统 的 范畴 知觉 ， 
结果 表明 ,与 标准 刺激 相 比 ， 在 大 脑 前 -中 区 域 的 
双 侧 脑 区 ， 范畴 内 和 范畴 间 刺 激 都 可 以 诱发 出 
MMN 成 分 , 并且， 范畴 间 刺 激 在 左 侧 脑 区 能 够 诱 
发 更 大 的 MMN 成 分 。 基 于 ERP 的 研究 还 可 以 区 
分 大 脑 对 声学 信息 和 音 系 范畴 的 不 同 加 工 ，Yu， 
Wang, Li 和 Li(2014) 使 用 与 Xi 等 人 (2010) 相 类 似 
的 连续 统 设 计 ， 分 别 考察 了 这 两 种 层面 的 信息 对 
汉语 声调 范畴 知觉 的 作用 , 结果 表明 ，, 音 系 范畴 
和 声学 差异 对 MMN 成 分 的 波幅 都 存在 显著 的 影 


非 语言 刺激 的 范畴 知觉 ， 他 们 发 现 , 非 语言 的 范 
畴 间 刺 激 比 范 畴 内 刺激 诱发 了 更 大 的 晚期 失 匹 配 
成 分 (late mismatch component), 而 语言 刺激 的 知 
觉 则 不 存在 这 种 范畴 效应 。 

与 行为 实验 的 情况 相 类 似 , 基于 ERP 的 研究 
结果 也 出 现 了 分 歧 。 由 上 文 可 知 ， 部 分 研究 结果 表 
明 , 声调 的 知觉 具有 范畴 化 特征 ， 表现 为 范畴 间 偏 
差 刺 激 比 范畴 内 偏差 刺激 诱发 的 电 生 理 反 应 更 大 
(Shen, 2015; Xi et al., 2010, Zhang et al., 2012); 而 
男 一 些 研究 则 没有 得 到 这 种 范畴 效应 (Zheng et al., 
2014)， 甚 至 得 到 与 之 相反 的 结果 (Chandrasekaran 
et al., 2009)。 我 们 认为 ,造成 这 些 差异 的 重要 原因 


响 ， 而 对 于 MMN 成 分 的 潜伏 期 ， 只 有 音 系 范畴 


是 声调 加 工 过 程 存 在 阶段 性 ， 即 前 注意 阶段 和 注 


存在 主 效应 。 他 们 认为 ， 这 两 种 层面 的 信息 在 汉 
语 声调 知觉 过 程 中 起 着 不 同 的 作用 ,声学 信息 只 
会 影响 声调 加 工 的 程度 ， 而 音 系 范 畴 既 会 对 声调 
加 工程 度 产 生 作 用 ， 也 会 影响 声调 加 工 的 时 程 。 
综 上 来 看 ,在 非 注意 加 工 阶段 ， 声调 的 知觉 过 程 
不 仅仅 依据 声学 信息 ， 也 在 一 定 程度 上 依赖 语言 
层面 的 信息 (Jia, Tsang, Huang, & Chen, 2015)。 


意 阶段 。 在 注意 加 工 阶段 ,声调 的 知觉 模式 是 范畴 
型 的 ， 即 在 该 阶段 ， 声 学 信息 和 音 系 信 息 都 得 以 
加 工 ， 以往 的 研究 对 此 争议 较 小 。 这 里 值得 注意 
的 是 前 注意 阶段 的 结果 , 在 前 注意 阶段 ， 是 否 存 
在 音 系 信 息 的 加 工 是 问题 的 关键 所 在 。 如 果 该 阶 
段 能 够 对 音 系 层 面 信息 的 加 工 ,那么 范畴 间 刺 激 
诱发 的 电 生 理 反 应 就 会 更 大 ; 如 果 该 阶段 只 对 声 


在 注意 加 工 阶段 ,范畴 内 偏差 刺激 和 范畴 间 
有 差 刺 激 也 会 诱发 不 同 的 电 生理 反应 (Shen, 2015; 
Zhang et al., 2012)。Zhang 等 人 (2012) 的 研究 结果 
表明 ,被 试 对 汉语 声调 连续 统 进行 反应 时 ,范畴 
内 偏差 刺激 在 左 、 右 双 侧 都 诱发 了 N2a 和 P3a 成 
分 , 并 且 范 畴 间 偏 差 刺 激 在 大 脑 左 侧 诱 发 了 更 大 
的 电 生理 反应 ,反映 了 注意 加 工 阶段 对 语言 信息 
的 加 工 。Shen (2015) 也 指出 , 不 管 是 在 早期 的 前 
注意 阶段 ,还 是 较 晚 的 注意 阶段 ， 普 通话 母语 者 
对 汉语 声调 的 知觉 都 呈现 出 范畴 型 知觉 模式 ， 范 
暑 间 偏 差 刺激 比 范畴 内 偏差 刺激 诱发 了 更 大 的 电 
生理 反应 。 

然而 , 另外 一 些 研究 却 得 到 了 不 同 的 结果 。 
Chandrasekaran 等 人 (2009) 对 汉语 普通 话 阴 平和 
阳平 (Tl 和 T2) 的 感知 研究 结果 表明 ,范畴 内 条 件 
下 诱发 的 MMN 大 于 范畴 间 条件 下 的 结果 。 该 研 
究 结 果 与 其 他 结果 不 同 ,可 能 是 因为 刺激 差异 导 
致 的 。 在 大 多 数 的 研究 中 ， 范 畴 内 和 范畴 间 的 刺 
激 与 标准 刺激 在 声学 层面 的 差异 是 相同 的 ， 即 标 
准 刺激 在 声学 空间 上 居于 范畴 内 偏差 刺激 和 范畴 
间 偏 差 刺 激 中 间 的 位 置 。 但 该 研究 所 用 的 范畴 间 
刺激 与 标准 刺激 在 声学 上 更 加 相似 ， 因 此 得 到 了 
相反 的 结果 。 Zheng 等 人 (2014) 对 比 了 语言 刺激 与 


Ti 


学 层面 的 信息 进行 加 工 ， 范 畴 效应 就 会 较 小 甚至 
不 出 现 。 到 目前 为 止 , 在 前 注意 阶段 是 否 存 在 语 
言 层面 的 信息 加 工 ， 学 界 的 看 法 仍 示 达成 一 致 。 

对 于 语音 信号 的 加 工 过 程 有 人 研究 者 提出 了 
两 阶段 模型 (two-stage model) (Luo et al., 2006), 
该 模型 认为 ， 在 早期 自动 加 工 阶段 ,， 右 脑 对 低层 
次 的 声学 信息 进行 加 工 ， 因 此 加 工 优 势 位 于 大 脑 
右 半 球 ; 但 到 了 注意 阶段 ， 较 高 层次 的 语言 信息 
获得 加 工 ， 加 工 优势 位 于 大 脑 左 半球 (Luo et al., 
2006)。 前 文 所 述 的 研究 结果 部 分 验证 了 该 模型 的 
合理 性 , 但 是 ， 前 注意 阶段 是 否 存 在 语言 信息 的 
MIE, 仍 有 待 于 进一步 的 研究 。 
2 影响 声调 范畴 知觉 的 非 声 调 因 素 

上 文 讨论 了 声调 本 身 的 特征 以 及 声调 加 工 的 
阶段 性 对 声调 范畴 知觉 的 影响 。 本 节 将 讨论 影响 
声调 知觉 模式 的 几 种 非 声调 因素 : 母语 背景 AE 
龄 、 声 调 所 处 语 境 以 及 刺激 属性 (语言 刺激 或 非 语 


.1 母语 背景 对 声调 范畴 知觉 的 影响 

大 量 行为 实验 的 结果 表明 ,被 试 的 语言 经 验 
会 影响 声调 的 知觉 。 与 非 声调 母语 者 相 比 ,声调 
母语 者 感知 母语 声调 时 的 范畴 化 程度 更 高 (例如 ， 
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普通 话 vs 英语 : Mattock & Burnham, 2006; Xu, 
Gandour, & Francis, 2006; 普通 话 vs. 法 语 :Hallé 
et al.，2004)。 而 非 声调 语言 的 母语 者 对 声调 进行 
范畴 感知 时 ,存在 一 定 的 困难 (Hallé et al., 2004; 
Zou, Zhang, & Cao, 2012)。Hallé 等 人 (2004) 对 中 
国 台 湾 汉语 母语 者 的 研究 显示 ,法 语 母 语 者 对 声 
调 的 感知 主要 依赖 物理 层面 的 声学 参数 的 差异 ， 
对 声调 范畴 的 感知 明显 弱 于 中 国 台湾 汉语 母语 
者 。Zou 等 人 (2012) 对 善 通话 阳平 -上 声 连 续 统 的 
研究 结果 也 表明 ,汉语 母语 者 呈现 范畴 知觉 ， 而 
日 语 母 语 者 的 范畴 化 倾向 不 明显 。 

母语 背景 会 对 声调 范畴 知觉 产生 影响 ,那么 
母语 的 声调 经 验 是 否 可 以 迁移 到 非 母 语 声调 的 知 
觉 过 程 中 呢 ? 张 林 军 (2010) 考 察 了 韩国 .日 本 和 泰 
国 留学 生 对 汉语 声调 的 感知 ， 结 果 表明 ， 零 起 点 
的 韩国 和 日 本 留学 生 的 知觉 是 连续 型 的 ， 泰国 留 
学 生 则 表现 出 一 定 的 范畴 化 特征 , 但 与 汉语 母语 
者 的 知觉 模式 存在 差异 。Peng 等 人 (2010) 进 一 步 
比较 了 语言 和 方言 背景 对 汉语 阳平 ~ 阴平 连续 统 


音 段 (辅音 、 元 音 等 ) 和 超 音 段 (语调 、 声 调 等 ) 加 工 
过 程 中 诱发 的 知觉 电 生 理 反 应 都 会 受到 被 试 语言 
经 验 的 影响 (Bidelman, Gandour, & Krishnan, 2011; 
Bidelman & Lee, 2015; Chandrasekaran, Krishnan, & 
Gandour, 2007; Kaan et al., 2008; Krishnan, Gandour, 
Xu, & Suresh, 2017; Xu, Gandour, Talavage et al., 
2006)。 例 如 , Chandrasekaran 等 人 (2007) 的 研究 结 
果 表 明 , 在 TI/T3(T3 为 偏差 刺激 ) 条 件 下 ， 普 通话 
母语 者 比 英语 母语 者 产生 了 更 大 的 MMN 成 分 。 

Bidelman 和 Lee (2015) 考 察 了 母语 背景 和 上 下 文 
语 境 对 汉语 阳平 -上 声 连 续 统 知 觉 的 影响 ,结果 
表明 ， 与 英语 母语 者 相 比 ， 普 通话 母语 者 在 进行 
声调 范畴 判断 时 ,产生 了 更 大 的 脑 电 反 应 ， 因 此 
他 们 认为 ， 早 期 的 听觉 皮质 活动 受到 母语 背景 的 
影响 。Zheng 等 人 (2014) 发 现 , 在 对 非 语言 刺激 的 
非 注意 加 工 过 程 中 ,粤语 母语 者 在 范畴 间 刺 激 条 
件 下 产生 了 更 大 的 电 生 理 反 应 ， 而 普通 话 母 语 者 
则 没有 出 现 范畴 效应 。 造 成 该 结果 的 原因 可 能 是 ， 
久 语 母语 者 受到 母语 音 系 的 影响 ,能够 更 好 地 区 


和 去 声 - 阴 平 连 续 统 知觉 的 影响 ,结果 表明 ， 善 通 
话 、 粤 语 和 德语 三 组 母语 者 ,范畴 边界 的 位 置 没 
有 差异 , 但 声调 母语 者 的 范畴 边界 宽度 显著 小 于 
德语 母语 者 ， 这 表明 声调 语言 母语 者 感知 这 两 种 
声调 的 范畴 化 程度 比 非 声调 母语 者 高 ， 而 两 种 方 
言 母 语 者 之 间 的 范畴 化 程度 没有 差异 .Zheng (2010) 
比较 了 粤语 、 普 通话 和 法 语 母 语 者 对 粤语 平 调 的 
知觉 模式 , 结果 表明 ， 粤语 母语 者 呈现 出 范畴 知 


分 音 高 高 度 和 和 斜率 的 变化 。 Zheng, Minett, Peng 和 
Wang (2012) 考 察 了 普通 话 母 语 者 和 粤语 母语 者 
对 粤语 声调 的 范畴 知觉 模式 ,结果 表明 ,在 注意 
条 件 下 ， 范 畴 间 偏 差 刺 激 和 范畴 内 偏差 刺激 诱发 
的 电 生 理 反应 也 会 受到 被 试 语言 背景 的 影响 ， 只 
有 粤语 被 试 表现 出 了 范畴 效应 ,范畴 间 偏 差 刺 激 
诱发 了 更 大 的 P300 成 分 。 

从 行为 结果 可 以 看 出 ,母语 的 声调 经 验 能 够 


觉 模式 ,普通 话 母 语 者 的 范畴 化 特征 较 弱 ,法 语 
母语 者 则 是 连续 知觉 模式 。Shen 和 Froud (2016) 
的 研究 考察 了 三 组 被 试 (汉语 水 平 较 高 的 英语 母 
语 者 、 完 全 不 懂 汉 语 的 英语 母语 者 和 汉语 母语 者 ) 
对 普通 话 声调 的 范畴 知觉 模式 ,结果 显示 , 汉语 
母语 者 表现 出 典型 的 范畴 知觉 模式 , 不 懂 汉 语 的 
英语 母语 者 辨认 的 范畴 边界 比 其 他 两 组 被 试 更 宽 ， 
且 没 有 出 现 区 分 高 峰 。 汉 语 水 平 较 高 的 英语 母语 
者 呈现 出 与 汉语 母语 者 相似 的 范畴 知觉 模式 。 王 
担 佳 . 刘 思 维 和 昨 玮 (2017) 对 两 种 汉语 方言 研究 的 
结果 表明 ， 重庆 话 母语 者 感知 普通 话 阴 平和 阳平 
的 模式 为 范畴 型 ， 但 范畴 化 程度 不 及 普通 话 母 语 
者 ， 她 们 认为 这 个 差异 是 重庆 话 声调 系统 中 不 存 
在 高 平 调和 升 调 的 对 立 所 导致 的 。 

语言 经 验 或 者 母语 背景 对 语音 范畴 知觉 的 作 
用 在 ERP 研究 中 也 被 发 现 。 大 量 实验 结果 表明 ， 


扩展 到 非 母语 声调 的 知觉 中 ,声调 语言 和 非 声调 
语言 的 被 试 感知 非 母 语 声调 存在 差异 ， 非 声调 母 
语 的 二 语 习 得 者 能 够 发 展 出 声调 的 范畴 知觉 模 
式 。 但 需要 注意 的 是 ， 母语 声调 系统 的 复杂 程度 
以 及 母语 声调 中 的 对 立 种 类 也 会 影响 到 声调 的 知 
觉 模 式 。 例 如 , Peng 等 人 的 结果 表明 ， 普 通话 和 粤 
语 母 语 者 对 普通 话 阳平 -阴平 和 去 声 - 阴 平 连续 统 
的 知觉 模式 没有 显著 差异 (Peng et al., 2010), 但 
Zheng 的 研究 结果 显示 ,普通 话 母 语 者 感知 粤语 平 
调 的 范畴 化 程度 比 粤语 母语 者 低 (Zheng，2010)。 
我 们 认为 ,该 结果 可 能 是 普通 话 和 粤语 声调 系统 
的 差异 造成 的 ， 粤语 有 9 个 声调 ,其 中 有 6 种 声调 
是 依靠 音 高 互相 区 别 的 ， 而 普通 话 只 有 4 个 声调 。 
在 感知 声调 对 立 种 类 比 母 语 少 的 普通 话 声 调 时 
粤语 母语 者 与 普通 话 母 语 者 没有 差异 ; 而 在 感知 
声调 对 立 种 类 比 母语 多 的 粤语 声调 时 ,普通 话 母 
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语 者 的 范畴 化 程度 就 比 粤语 母语 者 低 了 。 上 文 提 
到 的 王 报 佳 等 人 (2017) 的 研究 结果 表明 ， 即 便 母 
语 声调 系统 中 的 声调 音 位 数目 与 非 母 语 者 声调 一 
致 (重庆 话 和 普通 话 都 是 4 个 声调 )， 如 果 对 立 的 具 
体 情 况 不 同 , 在 感知 非 母 语 声调 时 范畴 化 程度 依 
然 会 稍 低 。 

基于 ERP 的 研究 结果 对 于 母语 经 验 在 声调 范 
晓 知 觉 中 的 作用 有 了 更 深入 的 揭示 ， 大 量 结果 表 
H, 在 前 注意 阶段 , 母语 背景 对 声调 知觉 的 影响 
已 经 开始 起 作用 ， 早 期 的 皮质 活动 也 会 受到 母语 
经 验 的 影响 。 我 们 认为 ， 这 些 结 果 可 以 有 两 种 解 
RE: 一 种 解释 是 ,在 前 注意 阶段 ， 对 声调 的 知觉 既 
有 声学 信息 的 加 工 , 也 有 语言 信息 的 加 工 ， 因 此 
母语 背景 可 以 通过 语言 信息 的 加 工 过 程 对 知觉 模 
式 产生 影响 。 具 体 来 说 ,， 声调 母语 者 由 于 母语 系 
统 中 存在 这 种 音 系 层面 的 范畴 差异 ,在 声调 知觉 
过 程 中 更 加 容易 感知 到 范畴 的 差异 ， 从 而 产生 更 
大 的 电 生 理 反 应 ， 而 非 声调 母语 者 长 时 记忆 中 没 
有 这 种 范畴 概念 ， 因 此 也 不 会 出 现 范畴 效应 。 第 
二 种 解释 是 ,在 前 注意 阶段 ,只 有 声学 信息 的 加 
T, 没有 语言 信息 的 加 工 。 和 母语 经 验 之 所 以 会 存 
在 显著 影响 ， 是 因为 声调 母语 者 长 期 受到 母语 声 
调 系统 的 影响 ， 对 某 些 声学 参数 的 变化 更 加 敏感 ， 
因此 ， 即 便 不 存在 语言 层面 的 信息 加 工 ， 声调 母 
语 者 对 某 些 声学 参数 的 高 度 敏 感 也 会 导致 范畴 效 
应 .总 之 , 在 非 注 意 阶段 ， 母 语 背景 是 通过 何 种 方 
式 对 声调 的 范畴 知觉 产生 影响 的 , 仍 有 待 于 更 加 
深入 的 实验 研究 。 
2.2 年龄 对 声调 范畴 知觉 的 影响 

年 龄 也 是 影响 声调 范畴 知觉 的 一 个 重要 因素 ， 
在 生长 发 育 的 不 同 阶段 ， 声调 的 知觉 会 呈现 出 不 
同 的 模式 。 语 音 知觉 发 育 的 研究 表明 , 在 出 生 后 
的 第 一 年 中 ,婴儿 会 出 现 语音 知觉 重组 (perceptual 
reorganisation) 现 象 ， 即 在 出 生 初 期 婴儿 对 母语 
和 非 母 语 的 语音 都 能 够 区 分 ,但 随 着 母语 的 输入 
的 增加 ， 婴 儿 会 逐渐 失去 辨别 非 母 语 语音 的 能 
力 。 以 往 的 研究 表明 ,婴儿 对 非 母 语 辅音 知觉 能 力 
的 下 降 出 现在 6 个 月 左右 (Polka & Werker, 1994), 
而 对 元 音 的 知觉 会 更 早 表现 出 该 特点 (Rvachew, 
Alhaidary, Mattock, & Polka, 2008)。 

关于 声调 知觉 , Mattock 和 Burnham (2006) 考 
察 了 6 个 月 和 9 个 月 大 的 英语 婴儿 和 汉语 婴儿 对 泰 
语 升 调 与 降 调 、 升 调 与 平 调 的 区 分 能 力 , 结果 表明 ， 


中 国 婴 儿 的 声调 知觉 能 力 不 断 增强 ,而 英语 婴儿 
的 声调 知觉 能 力 逐 渐 减 弱 , 6~9 月 龄 时 两 者 的 声调 
识别 成 绩 已 表现 出 显著 性 差异 。 为 了 进一步 验证 
非 声调 语言 的 婴儿 对 声调 辨别 能 力 的 下 降 是 否 早 
于 6 个 月 , Mattock, Molnar Polka 和 Burnham (2008) 
考察 了 4 个 月 .6 个 月 和 9 个 月 的 英语 和 法 语 婴 儿 ， 
结果 表明 ， 英 语 和 法 语 婴 儿 声 调 辨别 能 力 的 下 降 
的 确 出 现 于 6~9 月 之 间 。Yeung，Chen 和 Werker 
(2013) 比 较 了 母语 为 英语 ,普通话 和 粤语 的 婴儿 对 
粤语 声调 的 知觉 能 力 ,结果 表明 ,英语 婴儿 在 
4~9 个 月 期 间 对 声调 的 区 分 能 力 持续 下 降 ， 在 此 期 
间 普 通话 婴儿 和 粤语 婴儿 都 能 够 区 分 声调 ， 但 不 
同方 言 背景 的 两 组 婴儿 在 4 个 月 左右 就 开始 表现 
出 母语 偏好 。Liu 和 Kager (2014) 的 结果 有 所 不 同 ， 
也 们 发 现 ， 非 声调 语言 (荷兰 语 ) 的 婴儿 对 声调 的 
感知 表现 出 U- 型 的 发 展 模式 ， 即 婴儿 在 5~6 个 月 
时 可 以 对 声调 进行 区 分 , 到 9 个 月 左右 ， 他 们 对 
声调 的 敏感 有 所 退化 , 但 长 到 17~18 个 月 时 ,声调 
的 知觉 能 力 又 得 以 恢复 。 

近年 来 , 学 界 也 开始 使 用 电 生理 的 方法 研究 婴 
儿 言 语 知觉 过 程 的 神经 机 制 。EFriederici, Friedrich 
和 Christophe (2007) 比 较 了 4 个 月 大 的 德语 婴儿 和 
法 语 婴 儿 对 重音 模式 的 感知 ，ERP 结果 表明 ， 
语 背 景 会 影响 婴儿 感知 重音 时 的 大 脑 反应 ， 婴 儿 
对 母语 的 重音 模式 更 加 敏感 。Cheng 等 人 (2013) 考 
察 了 汉语 新 生 儿 和 6 月 龄 婴儿 感知 声调 时 的 脑 
反应 ， 结 果 表 明 , 在 TIT3(T3 为 标准 刺激 ) 条 件 下 ， 
新 生 儿 产生 了 正 向 的 失 匹 配 反应 (positive mismatch 
response, P-MMR), 而 6 个 月 大 的 婴儿 则 产生 了 
与 成 人 类 似 的 失 匹 配 负 波 (MMN); 在 T2/T3(T3 为 
标准 刺激 ) 条 件 下 ,新 生 儿 没有 出 现 显著 的 MMR， 
而 6 个 月 大 的 婴儿 却 出 现 了 P-MMR。 他们 认为 婴 
儿 的 年 龄 和 刺激 的 差异 程度 都 会 影响 婴儿 感知 声 
调 时 的 脑 电 反应 。 该 研究 让 我 们 联想 到 前 文 介 绍 
的 Chandrasekaran 等 人 (2007) 对 成 人 感知 T1/T3 和 
T2/T3 的 ERP 研究 ,成 人 的 结果 表明 ,声学 相似 
度 低 的 偏差 刺激 能 够 诱发 幅 值 更 大 的 MMN, 而 
婴儿 对 于 声学 差异 的 反应 显然 更 为 复杂 ,偏差 刺 
激 诱 发 的 MMR 同时 受到 婴儿 年 龄 和 刺激 声学 相 
似 度 的 影响 。 

研究 婴儿 的 声调 知觉 问题 ， 其 中 一 个 重要 的 
问题 则 是 ， 婴 儿 何 时 能 够 区 分 母语 声调 和 非 母 语 
声调 ， 对 非 母 语 声调 的 辨别 能 力 何 时 开始 下 降 。 
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根据 上 文 所 介绍 的 研究 ， 婴 儿 声 调 知觉 的 发 展 模 
式 与 元 音 和 辅音 都 有 所 不 同 ， 婴儿 对 非 母 语 声调 
敏感 程度 的 下 降 比 元 音 和 辅音 出 现 得 更 早 。 这 在 
一 定 程度 上 可 以 说 明 , 不 同 层次 的 语音 知觉 具有 
不 同 的 发 展 模式 。 非 声调 语言 的 婴儿 对 声调 的 感知 
呈现 出 U- 型 发 展 模式 ， 而 如 前 文 所 述 , 成 年 的 非 声 
调 语言 与 声调 语言 母语 者 对 声调 的 知觉 也 具有 不 
同 的 特征 。 因 此 , 我 们 认为 ， 婴 儿 在 后 期 所 谓 的 声 
调 知觉 能 力 的 恢复 ,可 能 仅仅 是 对 声学 信息 知觉 
的 恢复 ， 这 种 “恢复 ”并 不 意味 着 非 声调 语言 的 婴 
儿 重 新 发 展 了 对 声调 音 位 层面 的 知觉 加 工 能 
由 于 实验 条 件 的 限制 ， 目 前 学 界 对 婴儿 声调 
知觉 的 ERP 研究 仍 比 较 少 。 对 不 同 的 声调 进行 感 
知 时 ,4 月 龄 婴儿 甚至 新 生 儿 的 大 脑 反应 已 经 表现 
出 差异 ， 这 一 结果 与 行为 实验 的 结果 是 一 致 的 。 
关于 声调 语言 和 非 声调 语言 的 婴儿 在 感知 声调 时 
的 神经 机 制 , 还 有 待 进一步 的 研究 。 
2.3 ”声调 语 境 (tonal context) 对 声调 范畴 知觉 的 

影响 

声调 的 范畴 知觉 不 仅仅 依赖 音节 内 部 本 身 的 
基 频 线索 ， 上 下 文 语 境 中 的 音 高 变化 也 起 着 非常 
重要 的 作用 。 声 调 又 可 以 分 为 两 种 类 型 : 平 调和 
曲折 调 ， 从 前 人 的 研究 结果 看 ， 上 下 文 的 声调 语 
境 对 平 调和 曲折 调 的 影响 是 不 对 等 的 ， 一 般 来 说 ， 
声调 语 境 对 平 调 的 影响 要 大 于 曲折 调 。 例 如 ， 粤 
语 平 调 的 知觉 依赖 于 上 下 文 语 境 (Francis，Ciocca, 
Wong, Leung, & Chu, 2006; Wong & Diehl, 2003; 
Zhang, Peng, & Wang, 2012). Francis 等 人 (2006) 
发 现 ， 当 上 下 文 声调 的 基 频 较 低 时 ， 目 标 声 调 刺 
激 更 可 能 被 感知 为 高 调 ; 而 当 上 下 文 声调 的 基 频 
较 高 时 ,目标 声调 刺激 则 被 感知 为 低调 的 可 能 1 
更 大 。Wong 和 Diehl (2003) 使 用 粤语 的 三 种 平 调 
作为 目标 刺激 ,他们 发 现 , 同一 目标 刺激 在 基 频 
较 低 的 声调 语 境 中 ，99.5% 被 感知 为 高 平 调 ; 而 在 
基 频 较 高 的 语 境 中 ,被 感知 为 低 平 调 的 可 能 性 为 
95.8%; 当 语 境 的 平均 基 频 位 于 中 间 位 置 时 ， 则 
91.9% 的 情况 会 被 感知 为 中 平 调 -Zhang 等 人 (2012) 
的 结果 也 得 到 了 类 似 的 对 比 效应 。 声 调 语 境 也 会 
影响 粤语 平 调 的 范畴 知觉 模式 ， 粤语 平 调 的 知觉 
在 独立 音节 和 句 末 条 件 下 ， 呈 现 出 非 范 畴 化 特征 ， 
而 在 句 中 条 件 下 ,， 则 呈现 出 范畴 知觉 模式 (Francis 
et al., 2003; Zheng, 2010), Zheng (2010) 还 发 现 ， 
目标 声调 前 、 后 语 境 对 知觉 的 作用 是 不 对 等 的 ， 


目标 声调 后 接 音 节 基 频 的 高 低 会 对 目标 声调 的 知 
觉 模 式 产生 影响 ， 而 前 接 音节 的 作用 不 显著 。 

与 平 调 的 知觉 相 比 ， 上 下 文 语 境 对 曲折 调 的 
作用 更 加 复杂 。 一 些 研究 表明 ， 上 下 文 语 境 对 普 
通话 声调 的 感知 没有 显著 作用 。Fox 和 Qi (1990) 
考察 了 普通 话 阴 平 - 阳 平 连 续 统 的 知觉 ， 并 比较 
了 目标 刺激 单独 呈现 和 将 目标 刺激 与 前 接 音 节 同 
时 呈现 的 结果 ， 他 们 发 现 ,两 种 条 件 对 声调 知 党 
的 影响 较 小 且 不 稳定 。 其 他 一 些 研 究 却 表明 , 语 
境 能 够 对 声调 知觉 的 范畴 化 程度 和 范畴 边界 产生 
作用 。Chen 和 Peng (2016) 对 普通 话 阴 平 -阳平 连 
续 统 的 行为 研究 表明 ， 目 标 声调 的 前 接 语 境 能 够 
影响 声调 范畴 知觉 的 边界 位 置 : 当前 接 音节 基 频 
较 高 时 ， 目 标 音 节 更 倾向 于 被 感知 为 阳平 ; 如 果 
前 接 音节 基 频 较 低 ， 则 更 倾向 于 被 感知 为 阴平 。 
Bidelman 和 Lee (2015) 的 ERP 研究 结果 表明 ， 母 
语 背 景 和 上 下 文 语 境 对 普通 话 平 -上 声 连 续 统 知 
觉 都 存在 显著 作用 ; 语 境 对 母语 者 的 影响 更 大 ， 
具体 表现 为 ， 当 目标 声调 与 前 接 音节 同时 呈现 时 ， 
普通 话 母语 者 感知 目标 声调 的 范畴 化 程度 更 高 。 

总 的 说 来 ， 语 境 对 平 调和 曲折 调 知觉 的 作用 
有 所 不 同 ， 我 们 认为 有 以 下 几 种 因素 在 起 作用 。 
首先 ， 曲 折 声 调 的 知觉 , 更 多 依赖 声调 本 身 的 曲 
拱 特征 ， 因 为 不 同 的 曲折 调 以 及 曲折 调 与 平 调 之 
间 的 区 分 ,主要 是 依赖 曲 拱 特征 (包括 曲 拱 的 有 
无 )。 第 二 , 与 上 面 的 因素 相关 的 是 , 平 调 的 感知 
更 多 依赖 调 阶 的 高 低 ， 而 高 低 的 判断 是 相对 的 而 
非 绝对 的 ， 因 此 语 境 对 平 调 知 觉 的 作用 会 更 为 明 
显 。 第 三 ,声调 的 感知 具有 “ 延 后 性 ”， 即 ， 对 于 一 
个 声调 的 高 低 判 断 是 在 后 接 声调 出 现 之 后 才 实现 
的 ， 因 此 前 接 声 调 对 于 目标 声调 感知 的 作用 远 不 
如 后 接 声调 的 作用 大 。 
2.4 刺激 属性 (Speech vs. nonspeech) 对 声调 范畴 

知觉 的 影响 

声调 作为 一 种 超 音 段 特征 ， 必 须 负载 于 音 段 
之 上 。 在 以 往 的 研究 中 ， 负 载 声调 的 刺激 既 有 语 
言 刺 激 也 有 非 语 言 刺 激 ， 而 前 人 的 结果 表明 ， 刺 
激 属 性 会 影响 声调 知觉 的 范畴 化 (Xu, Gandour, & 
Francis, 2006)。 

从 行为 结果 来 看 ,不 管 声调 负载 于 语言 刺激 
还 是 非 语 言 刺激 ,声调 母 语 者 对 母语 声调 都 能 较 
好 地 进行 区 分 并 且 对 语言 刺激 条 件 的 区 分 能 
更 强 (Lee, Vakoch, & Wurm, 1996), 范畴 化 程度 更 高 
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(Xu, Gandour, & Francis, 2006; Zheng et al., 2012)。 
非 声调 母语 者 感知 声调 或 声调 母语 者 感知 非 母 语 
声调 , 语言 刺激 与 非 语 言 刺激 的 差异 不 明显 ,， 非 
声调 母语 者 对 非 语 言 刺 激 的 知觉 甚至 还 呈现 出 更 
强 的 范畴 化 特征 。 例 如 ,Xu 等 人 (Xu, Gandour, & 
Francis，2006) 考 察 了 普通 话 和 英语 被 试 对 普通 话 


果 出 现 了 分 歧 ， 且 不 同人 研究 者 在 ERP 人 研究 中 也 得 
到 了 不 同 的 结果 ,争议 的 焦点 在 于 , 在 非 注 意 阶 
段 ， 刺激 属性 是 否 能 够 作用 于 声调 的 范畴 知觉 。 
3 学界 争论 与 未 来 展望 


本 文 对 声调 知觉 的 范畴 化 问题 和 影响 声调 范 


阴平 ~ 阳平 连续 统 的 知觉 结果 表明 ,不 管 是 语言 
刺激 还 是 非 语言 刺激 ， 普 通话 母语 者 的 感知 结果 
都 呈现 出 范畴 化 特征 ; 但 是 英语 母语 者 对 非 语 言 
刺激 的 知觉 呈现 出 更 强 的 范畴 化 特征 。 

基于 ERP 的 研究 结果 与 行为 实验 的 结果 有 所 


畴 知觉 的 因素 进行 了 评述 ,关于 声调 的 范畴 知觉 ， 
学 界 较为 关注 以 及 迄今 为 止 尚未 解决 的 问题 如 下 : 

1) 决 定 声调 加 工 范畴 化 程度 的 最 重要 因素 是 
什么 ? 声调 范畴 化 加 工 过 程 的 神经 机 制 是 怎样 的 ? 
2) 母 语 背 景 对 声调 范畴 知觉 的 影响 是 否 受 到 


不 同 。 Ren, Yang 和 Li (2009) 考 察 了 前 注意 阶段 语 
言 刺激 和 非 语言 刺激 对 音 高 知觉 模式 的 影响 , 结 
RRHH, 不 管 音 高 负载 于 语言 刺激 还 是 非 语 言 刺 
激 ， 两 者 诱发 的 MMN 成 分 都 没有 显著 差异 ， 这 
说 明 , 被 试 在 前 注意 阶段 仅 对 声学 信息 进行 加 工 ， 
在 之 后 阶段 的 加 工 中 ,刺激 的 语言 功能 才 会 起 作 
Ho m, Zheng 等 人 (2014) 的 结果 却 表明 ， 对 于 
非 语言 刺激 ， 范 畴 间 刺 激 比 范畴 内 刺激 诱发 了 更 
大 的 晚 基 失 匹 配 成 分 (ate mismatch component), [fil 
对 于 语言 刺激 ， 则 不 存在 这 种 范畴 效应 。 他 们 认 
A, 与 语言 刺激 相 比 ， 非 语言 刺激 可 以 诱发 更 大 
的 范畴 效应 ， 可 能 是 由 于 在 前 注意 阶段 的 声调 知 
觉 主要 受到 谐 波 结构 的 影响 ， 非 语言 刺激 的 谐 波 
结构 更 简单 更 有 规律 性 ， 因 此 范畴 效应 更 大 。 田 
一 种 解释 是 听觉 皮层 的 激活 以 及 失 匹 配 成 分 的 产 
生 受 到 了 电影 及 字幕 等 视觉 刺激 知觉 的 抑制 一 一 
尽管 在 语言 和 非 语言 条 件 下 ， 被 试 都 会 关注 字幕， 
但 在 语言 刺激 条 件 下 ,字幕 的 干扰 可 能 更 大 。 另 
外 有 研究 表明 , 在 注意 加 工 阶段 ， 与 非 语 言 刺 激 相 
比 ， 语 言 刺激 的 范畴 效应 更 大 (Zheng et al., 2012)。 

从 以 往 的 行为 研究 来 看 ， 刺 激 属 性 和 母语 背 
景 都 会 对 声调 的 范畴 知觉 产生 作用 , 两 因素 之 间 
还 存在 交互 作用 。 仅 当 声 调 母 语 者 感知 母语 声调 
时 ， 语 言 刺 激 才 能 够 有 助 于 声调 知觉 的 范畴 化 ， 
也 就 是 说 ， 只 有 在 这 种 条 件 下 ,被 试 长 时 记忆 中 
的 声调 原型 才 会 被 激活 ， 并 作用 于 声调 的 范畴 知 
觉 。 而 非 声调 母语 者 感知 声调 或 声调 母语 者 感知 
韭 母 语 声调 , 语言 刺激 和 非 语言 刺激 没有 差异 ， 
这 是 因为 被 试 长 时 记忆 中 不 存在 与 感知 目标 相似 


母语 声调 系统 复杂 程度 的 制约 ? 母语 背景 作用 于 
声调 范畴 知觉 的 内 在 神经 机 制 是 怎样 的 ? 

3) 上 婴儿 声调 范畴 知觉 能 力 的 发 展 模式 是 怎样 
的 ? 在 声调 知觉 过 程 中 ， 婴 儿 和 成 人 的 神经 机 制 
有 哪些 相似 性 和 差异 ? 

4) 母 语 背 景 、 年 龄 、 语 境 和 刺激 属性 是 如 何 
共同 作用 于 声调 范畴 知觉 的 ? 

如 前 文 所 述 ， 虽 然 学 界 对 声调 范畴 加 工 的 行 
为 和 神经 机 制 研究 已 经 取得 一 些 成 果 , 但 仍 有 诸 
多 问题 存在 争议 , PANU A, 未 来 的 研究 可 以 从 
以 下 几 个 方面 进一步 展开 。 

首先 , 调 形 的 相似 度 与 声调 知觉 模式 之 间 的 
关系 有 待 通过 更 多 的 实验 尤其 是 电 生理 实验 加 以 
验证 。 目 前 行为 实验 的 研究 结果 表明 ， 曲 拱 特征 
不 同 的 声调 的 知觉 呈现 出 明显 的 范畴 化 特征 ， 而 
曲 拱 特征 相似 度 较 高 的 声调 则 感知 为 连续 型 或 弱 
范畴 化 型 ， 具 体 表 现 是 辨认 结果 呈现 出 范畴 化 特 
点 ， 而 区 分 结果 无 法 通过 辨认 结果 进行 预测 ,或 
章 差 刺激 没有 诱发 出 MMN。 如 前 文 所 指出 的 那 
样 ， 区 分 实验 结果 受到 了 诸多 因素 的 影响 ， 区 分 
任务 本 身 又 具有 一 定 的 复杂 性 , 尤其 是 个 体 差异 
历来 被 人 们 所 忽视 ,因此 对 于 区 分 实验 结果 不 宜 
像 过 去 那样 采用 均值 来 对 结果 进行 简单 评估 ， 而 
是 应 该 从 刺激 排序 、 刺 激 在 连续 统 中 的 位 置 以 及 
个 体 差异 等 几 个 方面 进行 深入 细致 的 分 析 。 

如 上 文 所 述 , 行为 实验 的 结果 在 很 大 程度 上 
受到 了 行为 实验 无 法 克服 的 设计 缺陷 的 作用 ， 因 
此 基于 行为 实验 结果 提出 的 假设 是 否 正确 ,还 需 
通过 实验 技术 的 更 新 加 以 验证 。 曲 拱 特征 的 相似 


的 声调 原型 ,无 法 进行 匹配 ,被 试 只 能 依靠 声学 
信息 进行 知觉 判断 ， 因 此 语言 刺激 与 非 语言 刺激 
不 存在 显著 差异 。 基 于 ERP 研究 结果 与 行为 结 


度 ， 即 声学 层面 的 相似 度 ， 是 否 能 够 在 大 脑 加 工 
过 程 中 反映 出 来 ,影响 声调 范畴 知觉 的 因素 到 底 
是 什么 都 有 待 借助 电 生理 技术 进行 更 深入 的 研 
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究 。 而 从 目前 的 研究 现状 来 看 ， 这 方面 的 研究 几 
乎 还 是 一 个 空 

第 二 ,关于 母语 背景 对 声调 范畴 知觉 的 影响 ， 
未 来 研究 可 以 关注 一 下 几 个 问题 : 第 一 ， 以往 研 
究 主要 关注 声调 语言 和 非 声调 语言 被 试 之 间 的 差 
异 , 我 们 认为 这 是 远 远 不 够 的 。 未 来 的 研究 中 需 
要 充分 考虑 不 同 声调 语言 声调 系统 的 复杂 程度 。 
比如 ， 母 语 声调 系统 的 复杂 程度 是 否 会 影响 被 试 
感知 声调 的 能 力 ? 是 否 母语 声调 系统 越 复 杂 , 在 
感知 非 母 语 声调 时 就 会 越 敏感 ?第 二 ， 母 语 背景 
对 声调 范畴 知觉 的 影响 ， 主 要 发 生 在 认 知 加 工 的 
哪 一 层面 ? 哪 一 阶段 ? 母语 经 验 是 否 只 会 影响 语 
言 信 息 的 加 工 ? 是 否 也 会 影响 到 声学 参数 的 感 
知 ? 只 有 把 这 些 具体 问题 研究 清楚 了 , 才能 更 好 
地 解释 母语 背景 对 声调 范畴 化 知觉 的 作用 。 另 外 ， 

言 背 景 对 声调 感知 的 作用 ,学 界 研究 仍 比较 
少 。 汉语 的 方言 资源 非常 丰富 ， 而 各 汉语 方言 在 
声调 种 类 和 调 形 上 千差万别 。 未 来 的 研究 应 该 加 
大 力度 研究 汉语 方言 母语 者 对 非 母 语 方言 声调 的 
知觉 ， 以 期 在 声调 知觉 的 细节 上 得 到 更 深入 和 更 
全 面 的 结果 。 

第 三 ,关于 年 龄 对 声调 知觉 能 力 的 影响 ， 如 
前 文 所 述 ，“ 有 研究 认为 婴儿 的 声调 知觉 能 力 呈 U- 
型 发 展 模式 。 我 们 认为 这 只 是 一 个 初步 的 结论 ， 
有 待 加 以 精准 化 研究 ,并 与 成 人 非 母 语 声调 的 感 
知 研 究 进行 联系 。 所 谓 精 准 化 研究 ， 是 对 一 系列 
细节 问题 的 深入 讨论 , 例如 ， 声调 感 知 能 力 的 U- 
型 发 展 与 整个 语音 能 力 的 发 展 之 间 是 什么 关系 ， 
婴儿 非 母 语 声调 感知 能 力 的 恢复 期 何 时 结束 、 在 
何 种 水 平 上 结束 ， 婴 儿 对 非 母 语 声调 的 感知 特征 
是 什么 等 等 。 另 外 , 声调 语言 和 非 声调 语言 的 婴 
儿 对 声调 感知 过 程 中 的 神经 机 制 , 也 有 待 进一步 
研究 。 这 里 最 重要 的 问题 是 ,声调 语言 的 婴儿 对 
母语 声调 的 感知 具有 相当 的 复杂 性 ， 或 者 说 婴儿 
和 成 人 对 母语 声调 的 感知 具有 不 同 的 特点 ， 这 些 
不 同 特点 都 有 哪些 ， 它 们 是 如 何 逐 渐 消 失 的 ， 都 
需 通 过 更 多 的 电 生 理 实验 加 以 深入 研究 。 

第 四 ,关于 语 境 对 声调 感知 范畴 化 的 影响 ， 
目前 学 界 得 到 的 结果 是 一 致 的 ， 即 , 在 孤立 条 件 
或 者 句 末 、 词 末 条 件 下 未 呈现 范畴 化 知觉 模式 的 
声调 ,在 句 中 或 者 词 首位 置 的 感知 都 会 出 现 范畴 
化 程度 的 加 强 。 如 上 文 所 述 , 我 们 猜测 这 与 声调 
感知 的 延 后 性 相关 。 但 “ 延 后 性 ”只 能 对 前 后 语 境 


ae a 


影响 的 不 对 称 给 予 解释 ， 却 无 法 说 明知 觉 模式 从 
非 范 畴 型 到 范畴 型 的 改变 。 这 一 问题 的 解决 除了 
需要 在 实验 设计 上 有 所 突破 外 ,， 纯 理论 层面 的 讨 
论 也 许 是 更 加 重要 的 。 

最 后 ， 母 语 背景、 年 龄 、 语 境 和 刺激 属性 对 
声调 范畴 知觉 的 作用 是 相互 影响 的 ， 比 如 ， 刺激 
类 型 对 范畴 知觉 的 影响 在 声调 母语 者 和 非 声 调 母 
语 者 之 间 存 在 差异 。 那 么 , 这 四 种 因素 是 如 何 单 
独 起 作用 ,它们 之 间 又 是 如 何 共 同 起 作用 的 呢 ? 
还 有 有 待 于 进一步 的 研究 。 
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Abstract: Categorical perception (CP) refers to the ability that listeners can distinguish cross-category 
stimuli, but cannot discriminate different stimuli within the same category. The degree of categorization for 
lexical tone perception may be influenced by the acoustical similarity of different tones. The perception of 
two similar tones seems to be less categorical than that of dissimilar tones. In addition to the internal 
features of tones, the factors influencing the categorical perception of lexical tone include language 
experience, age, tonal context and stimulus type (speech or nonspeech). The use of electrophysiological 
techniques has advanced the study of categorical perception of lexical tone, and is expected to be helpful in 
solving more theoretical problems. 
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